Combinaison des algorithmes génétique et de recuit simulé pour la conception physique des entrepôts de données
نویسندگان
چکیده
RÉSUMÉ. La fragmentation de données est une des techniques utilisée dans la conception physique des entrepôts de données. Elle permet d’accélérer l’exécution des requêtes OLAP et de faciliter la gestion des données de l’entrepôt. Pour fragmenter un entrepôt de données relationnel, la meilleure manière consiste d’abord à décomposer les tables de dimension ensuite à utiliser leurs schémas de fragmentation pour partitionner la table de faits. L’espace de recherche pour sélectionner le schéma de fragmentation optimal peut être très important. Dans ce papier, nous formalisons d’abord le problème de sélection d’un schéma de fragmentation pour un entrepôt de données relationnel comme un problème d’optimisation avec une contrainte de maintenance. Nous proposons ensuite une méthode hybride combinant un algorithme génétique et un algorithme de recuit simulé pour résoudre ce problème. Enfin, des expérimentations basées sur le benchmark APB-1 release II sont présentées afin de valider nos algorithmes.
منابع مشابه
ParAdmin : Un Outil d'Assistance à l'Administration et Tuning d'un Entrepôt de Données
Résumé. Les entrepôts de données ont rendu les tâches d’administration et de tuning plus complexes que dans les bases de données traditionnelles. Cela est dû aux caractéristiques des entrepôts de données : la volumétrie, les requêtes complexes, les délais de réponse exigés par les décideurs et la gestion de l’évolution. Dans ce contexte, une panoplie de techniques d’optimisation ont été proposé...
متن کاملLes index pour les entrepôts de données : comparaison entre index arbre-B et Bitmap
Résumé — Avec le développement des systèmes de décisionnel en générale et les entrepôts de données de manière particulière, il est devenu primordiale d’avoir une visibilité de la conception de l’entrepôt de données avant sa création, et cela vu l’importance de l’entrepôt de données qui se considère la source unique des données donnant sens à la décision. Dans un système de décisionnel, le bon f...
متن کاملLa fragmentation dans les entrepôts de données : une approche basée sur les algorithmes génétiques
Résumé. La fragmentation horizontale est une technique d’optimisation non redondante de requêtes décisionnelles de type ROLAP. L’utilisation de cette technique dans les entrepôts de données représente un enjeu plus important que dans un contexte de bases de données traditionnelles. Cette importance est due au différents choix des tables (de dimensions ou des faits) à fragmenter. Dans le context...
متن کاملEchantillonnage optimisé de données temporelles distribuées pour l'alimentation des entrepôts de données
Résumé. Les entrepôts de données sont de plus en plus alimentés par des données provenant d’un grand nombre de capteurs. Les capteurs trouvent leur utilité dans plusieurs domaines : médical, militaire, trafic routier, météorologie ou encore des données de consommation électrique. Pour faire face à la volumétrie et au taux d’arrivée des flux de données, des traitements sont effectués à la volée ...
متن کاملDu XML au multidimensionnel : Conception de magasins de données
Résumé. Avec l’ouverture des entreprises sur l’Internet, les sources de données englobent davantage des données échangées avec les partenaires et/ou issues du Web. Dans ce cadre organisationnel ouvert, les documents XML constituent des sources de données plus utilisées aussi bien pour le stockage que pour les échanges transactionnels. Ce nouveau format de données a motivé des propositions de mo...
متن کامل